home
***
CD-ROM
|
disk
|
FTP
|
other
***
search
/
Nikkei Mac 20
/
NIKKEI-MAC-CD-VOL-20-1998-12.ISO.7z
/
NIKKEI-MAC-CD-VOL-20-1998-12.ISO
/
オンラインソフト
/
5.文書作成支援
/
ConvChar 0.8.2.sea
/
ConvChar 0.8.2 Folder
/
ConvChar0.8.2ヌ…ヌャヌ「ヌƒ
< prev
next >
Wrap
Text File
|
1998-07-03
|
12KB
|
348 lines
テキスト変換ユーティリティー ConvChar 0.8.2
■ConvCharとは
ConvChar は定型的なテキスト変換をドラッグ&ドロップで簡単に行えるアプリケーション・
プログラムです。
■Ver. 0.8.2での変更点(98年6月)
設定ダイアログに「辞書の扱い」ポップアップメニューを新設、変換辞書を複数ロードして
文字列の一括置換を行う際に「順次処理する」を選択できるようにしました。
従来は複数の辞書を一つの辞書として扱い、内容が矛盾する場合は1、2、3の順に優先し
て一括処理していました。新設した「順次処理する」選ぶと、1の辞書で置換した出力結果を
2の辞書でさらに置換する、といったように複数の辞書による置換を個別に順次自動処理でき
ます。なお、「マージする」を選べば従来通り処理します。
■「順次処理する」のメリット
たとえば、文中に混在している「サーバ」と「サーバー」という文字列を「サーバー」に統
一したい、という場合を例に挙げます。
単純に「サーバ」を「サーバー」に置換してしまうと、もともと「サーバー」だった部分は
「サーバーー」になってしまいます。これを回避するには「サーバー」を文章中に絶対に出て
こない文字列、たとえば「####」に置換します。次に「サーバ」を「サーバー」に置換し
ます。最後に「####」を「サーバー」に置換すればうまくいきます。しかし、これを複数
の単語に対して何度も行うとなると面倒な作業です。
もちろん、正規表現を使った検索置換をマスターしていればそれほどでもないのですが、習
得する気がない人も少なからずいらっしゃることでしょう。また毎回、定形的に繰り返して行
うなら手間は一度で済ませたいものですね。
今回の「順次処理する」を利用し、複数の辞書を作る手間さえ厭わなければ、このような条
件分岐的な要素を含む検索置換が可能です。
■使い道
●用語の統一、言い替え。(7)
●通信ログの不要行削除、DOSテキストの改行変換。(6、7)
●改行つきテキストの行改行削除(7)→サンプル辞書参照。
●翻訳ソフトの前処理。(7、8)
●英単語、日本語置換による簡易翻訳支援。(7、6)→サンプル辞書参照。
●IM ( FEP ) や翻訳ソフトの辞書メンテナンスに。(1、2、4、5、7)
表計算ソフト(列順入れ替え)と組み合わせて効率よく辞書テキストを加工、変換できます。
●CD-ROM や複数のボリューム上に散在する "Read Me" ファイルなどを、好みのテキスト
エディタ書類として一カ所のフォルダに保存する。(8)
■サポートする変換は以下の7つで、組み合わせて一度に行えます
1: タブ→スペース整形
タブで整形された文書を、スペースで整形し直します。
2: スペース→タブ整形
1の逆です。「タブ間隔」を"1"に設定した場合は単純に半角スペースを同数のタブに置換。
▲タブ←→スペースの一対一置換は「文字列の置換」でも可能です。
(バージョン0.8ドキュメントでの本機能の説明は記述ミスです。お詫びします)
3: 英単語に分割
英文テキストを単語ごとに別行にします。
4: 行のソート
行改行されたテキストを文字コード順に並べ替えます。
(オプションでナチュラルオーダーソート)
5: 重複行をまとめる
連続する同一の行を一つにまとめます。ソート後なら全ての重複行をまとめます。
6: 空白行を除去
3つ以上連続した改行 (CR) を2つにします。
7: 文字列の置換
予め作成した辞書ファイルに従って文字列を一括置換します。辞書ファイルは通常
の TEXT ファイルを使用しますので簡単に作れます。
8: Non
内容の変換をせず、元ファイルの内容を複製した TEXT ファイルを作製します。
作成アプリケーションの違う文書や、あちこちのボリュームにある文書を一カ所に
常用するテキストエディタの書類として保存できます。
処理対象ファイルは、デフォルトのままではファイルタイプが "TEXT" のものと
SimpleText の「編集不可書類」 ( ttro ) ですが、設定次第でファイルタイプに関わらず
開けますから、ワープロソフト文書も処理できます。その場合、制御文字を除去します。
出力ファイル名は元ファイル名の末尾に "+" をつけたものになります。
■インストール
ConvChar をハードディスクにコピーするだけです。また、用途別に複数の ConvChar
をインストールすると、いちいち設定をやり直す手間が省けます。(設定は初期設定ファイル
を作成せず、アプリケーション内部に保存されます)
▲「文字列の置換」は大量にメモリを消費します。複数の辞書や大きな辞書を使う場合は、
あらかじめ ConvChar のメモリ使用サイズを大きめにしてください。
■使い方
ConvChar を起動すると、ファイル選択ダイアログが現れます。いったんキャンセル
(Escキー)して、ファイルメニューから「設定」を選んでください 。
▲初回の使用前に、「タブ間隔」と「出力ファイルのクリエータ」を必ず確認してください。
迷った場合は、「初期設定に戻す」ボタンを押してください。
▲変換辞書は「ロード」ボタンをクリックして選択します。
(起動ボリュームを変更した場合は、辞書の再定義が必要です)
▲「辞書の扱い」で「マージする」を選択した場合は、複数の辞書を一つの辞書として扱い、
内容が矛盾する場合は1、2、3の順に優先して一括処理します。
▲「順次処理する」選ぶと、1の辞書で置換した出力結果を2の辞書でさらに置換する、
といったように複数の辞書による置換を個別に順次自動処理します。
▲「置換時に大文字、小文字を同一視」をチェックすると処理に時間がかかります。
▲「ナチュラルオーダーソート」にチェックをいれると、ナチュラルオーダーでソートを
行います。行頭に番号やアルファベット(半角)を打ってあるリストのソートに便利です。
ただし通常のソートよりも時間がかかります。(このドキュメントの最後に「ナチュラル
オーダーソート」の簡単な説明があります)
▲「タブ間隔」は「タブ→スペース整形」および「スペース→タブ整形」時に、タブ間隔を
半角スペース何個相当と見なすかを指定します。初期設定は "4" です。
▲「対象とするファイルタイプ」で「何でもいい」を選択すればワープロ書類も開けます
が、テキスト文字列以外の情報は無視されます。また、書類によっては制御コードなどが
大量のゴミとなって残ります。ワープロソフトによっては全く読めないこともあります。
どうしても、自分の持っていないワープロソフトの書類の内容が知りたいときに使用してく
ださい。
▲「出力ファイルのクリエータ」は直接 FileCreator を入力するか、「アプリ選択」
ボタンをクリックしてテキスト編集アプリケーション、またはそのアプリで作成された
書類を選んでください。初期設定は "JEDT" (Jedit) になっています。
▲「テキストの出力先」を「ConvChar(本体のある)のフォルダ」、「(変換)元ファ
イルのフォルダ」、「(その都度)出力時に指定」の3つから選択します。
「設定」ボタンを押しダイアログを閉じて、ファイルを選んで処理内容を選択します。
▲処理内容は同時に5つまで選べます。同じ処理を二度指定できますが、文字列の置換は
一度しか選択できません。
▲処理内容が違っても同じ名前のファイルを再度処理すると、出力ファイルが上書きされ
てしまいます。比較したい場合は、先に処理した方のファイル名を変えておいてください。
(とくに "Read Me" ファイルは同名のものが多いので十分注意してください)
■変換辞書の作り方
ConvChar で文字列の置換に使う変換辞書は、通常のテキストファイルですから、簡単に作
成、登録ができます。
書式は
置換前文字列<タブ>置換後文字列<改行(CR)>
です。( "<" と ">" は不要です)
置換前文字列<タブ><改行(CR)>
とすれば "置換前文字列" は削除されます。
▲改行(CR)は "¥r"、LFは"¥n"、タブは "¥t" 、半角スペースは "¥s" と半角英文字で
記述します。
▲"¥r"、 "¥t" などを文字そのものとして記述する場合は、それぞれ "¥¥r"、 "¥¥t" と
記述します。
▲改行、タブを含む辞書を同時に複数ロードして「マージする」で置換すると予想外の結果
になることがあります。内容が矛盾しないように工夫して1つの辞書にまとめたうえで処理
するか、「順次処理する」を選んでください。
▲変換辞書は作製、追加したあと「行のソート」「重複行をまとめる」処理をしてください。
▲英単語を置換元にするときは、置換時に大文字、小文字を同一視するかどうかを、最初
に決めてから作成してください。
▲2つの矛盾する内容の辞書をロードした場合、「辞書の扱い」で「マージする」を選択
していると辞書ロード・メニュー上方で指定されているのが優先されます。
▲1つの辞書内で矛盾する内容があった場合は、行順で後から出現した方に変換されます。
▲解りにくい場合は同梱の「変換辞書サンプル」を参考にしてください。
==========================================================================
■(例)通信ログなどから、決まり物の不要行を削除する辞書を作成する
(BBSのメニューや毎回表示されるお知らせ、バナーを削除して快適にログ・ブラウズ)
1. 削除したい不要行をできるだけ多く含む通信ログなどを用意。
2. "¥r<タブ>¥¥r¥t¥r<改行(CR)>" という一行辞書で、用意したログを文字列置換する。
3. できたファイルから不要行として削除したい行以外を、手動で選択し削除する。これで
辞書は完成。
4. 3のファイルを辞書に指定し「文字列の置換」後に「空白行を除去」を行う。
■(例)Mac文書をDOS用に変換する一行置換辞書
"¥r<タブ>¥r¥n<改行(CR)>"
■(例)DOS文書をMac用に変換する一行置換辞書
"¥r¥n<タブ>¥r<改行(CR)>"
==========================================================================
■バージョン・ヒストリー
・Ver. 0.3 (94年7月) 初公開バージョン。
・Ver. 0.4 (94年8月) 1: ファイル出力先を選択できるようにした。
2: ソートを高速化。
3: 辞書ロードなどのバグを修正。
・Ver. 0.5 (96年3月作成、7月公開)
1: FATバイナリー化した。
2: 細かなバグを修正。
・Ver. 0.6 (96年4月) 未公開。
・Ver. 0.7 (97年3月) 1: オプションでナチュラルオーダーソートを追加。
2: 「文字列の置換」で、内部的に英語、日本語の処理を区別して
作業するように改善、特定の条件下で発生していた文字化けを解消。
3: その他、インターフェースなどの細部を改善。
・Ver. 0.8 (97年5月) 1: 辞書ファイルを参照して行う文字列の一括置換で、「改行(CR)」
と「LF」、「タブ」を扱えるようにした
2: スペース→タブ整形機能を見直し内部処理方法を改善。
3: タブ→スペース、スペース→タブ「置換」の名称を機能に即した
「整形」へと名称変更。
4: 改行だけの行を含むテキストに「重複行をまとめる」処理をした場
合に異常終了する問題を修正。
・Ver. 0.8.1 (97年6月) 1: 0.8で「置換時に大文字、小文字を同一視」にチェックを入れて、
日本語(2byte) 文字列を対象に「辞書を使った文字列の一括置
換」を行うと、正しく置換ができなかった不具合を修正。
2: 一括置換辞書で、半角スペースを "¥s" で記述できるようにした。
■開発環境及び動作確認環境
Mac OS 8.1、CodeWarrior Pro2、ResEdit 2.1.3
Power Macintosh 6100/60AV、8600/250、PowerBook 2400。
■配布条件
本プログラムはフリーウェアです。配布の際は "ConvChar0.8.2 Folder" の内容を変更せず、
フォルダごとお願いします。転載していただく場合は下記にEメールでご連絡ください。
また、便利な使い方や、自作の辞書で重宝なものができればご連絡いただくとともに、公
開していただければ幸いです。
なお、本プログラムを使用することによって発生した問題に対する責任は、一切取れませ
ん。各々の責任において使用して下さい。
本プログラムの著作権は作者・金親はるかにあり、作者の許可なく改変して配布したり、
販売または営利目的で使用すること、商品に添付して配布することを禁止します。
■連絡先
e-Mail: VX1H-KNOY@asahi-net.or.jp
Asahi-net mail: VX1H-KNOY
NIFTY-Serve: GEC02334
金親寿男
URL: http://www.asahi-net.or.jp/~VX1H-KNOY/fw/fw.html
==========================================================================
■ナチュラルオーダー(Natural Order)ソートの簡単な説明
----(例1)----
5.到着
10.夕食
1.起床
4.出発
3.出発準備
12.就眠
7.昼食
2.朝食
9.帰還
11.宴会
8.帰路
6.作業
---------------
(例1)のようなリストを普通にソートすると
----(例2)----
1.起床
10.夕食
11.宴会
12.就眠
2.朝食
3.出発準備
4.出発
5.到着
6.作業
7.昼食
8.帰路
9.帰還
---------------
結果は(例2)にのように困ったことになります。これを避けるために "1" を "01" と
するのが一般的ですが、行数が3桁になるとまずお手上げです。
ナチュラルオーダーのソートなら、問題はありません。(例3)になります。
----(例3)----
1.起床
2.朝食
3.出発準備
4.出発
5.到着
6.作業
7.昼食
8.帰路
9.帰還
10.夕食
11.宴会
12.就眠
---------------
さらに英語の大文字、小文字も通常ソートなら、A〜Zの次にa〜zの順番になりますが
ナチュラルオーダーソートだと、AaBbCcDd〜Zz の順番になります。
▲ConvCharでは全角 (2byte) 文字のナチュラルオーダーソートはサポートしていません。
---------------
▲ナチュラルオーダーソートは、Stuart Cheshire氏<cheshire@CS.Stanford.EDU>
のフリーウエア機能拡張 "Natural Order" の機能及びソースを参考にしました。
==========================================================================
end of doc